結合韻律與聲學訊息之強健性漢語語者驗證系統 (Incorporating Prosodic with Acoustic information for Robust Speaker Verification) [In Chinese]
نویسندگان
چکیده
منابع مشابه
結合聲學與韻律訊息之強健性語者辨認方法 (Combination of Acoustic and Prosodic Information for Robust Speaker Identification) [In Chinese]
語者辨認系統在公共電話網路中,通常會遇到未知不匹配話筒和辨認語料不足的問題。 為增進語者辨認系統對未知話筒之強健性,與有效利用有限語料,我們提出一融合下層聲學 與上層韻律訊息之架構,首先利用(1)最大相似先驗知識內插法(maximum likelihood-a priori knowledge interpolation,ML-AKI)方法估計與補償話筒聲學特性,並以(2)最小 錯誤鑑別式法則(Minimum Classification Error, MCE)訓練語者模型,以拉大不同語者間 聲學模型的距離,與利用(3)韻律訊息特徵分析(eigen-prosody analysis, EPA)為輔助,量 測不同語者間的韻律模型距離,最後利用(4)線性迴歸的方式融合聲學與韻律模型分數得到 最後的辨識結果。 實驗使用 Handset TIMIT(HTIMIT)語料庫,以 leave-on...
متن کامل結合關鍵詞驗證及語者驗證之雲端身份驗證系統 (A Cloud Speaker Authentication System Based on Keyword Verification and Speaker Verification) [In Chinese]
電腦和網際網路的誕生,讓人們的生活越來越便利。而隨著行動裝置的快速發展,人類 的生活方式更是產生了非常大的變革,不僅需要的資訊,信手拈來便可以獲得;許多企 業所提供的新興商品與服務交易,更是在彈指之間便可以順利完成。因此,如何在網際 網路上提供使用者方便、快速、彈性、可靠的身份驗證,並免除使用者記憶及輸入一大 堆用戶名稱及密碼的負擔,便成為一個重要的課題。本研究結合了關鍵詞驗證和語者驗 證技術,讓使用者不需要記憶及輸入冗長與煩雜的資訊,只要對著智慧型行動裝置說話, 身份辨識系統便可以在網際網路的環境中對使用者來進行身份驗證。我們以隱藏式馬可 夫模型和高斯混合模型分別實作了關鍵詞驗證模組與語者驗證模組,並以分散式架構實 作出雲端即時身份辨識系統。我們以 TCC-300 語料進行語者模型參數和訓練流程的調校 實驗,以改進語者驗證效能的訓練流程;並對背景語者篩選方法及性別相關模型進行實 驗...
متن کامل整合邊際資訊於鑑別式聲學模型訓練方法之比較研究 (A Comparative Study on Margin-Based Discriminative Training of Acoustic Models) [In Chinese]
鑑別式聲學模型訓練在近代自動語音辨識(Automatic Speech Recognition, ASR)中扮演 重要的角色。在許多基於不同思維且能有效地提昇辨識率的鑑別式聲學模型訓練方法陸 續被提出後,對於訓練方法的相關推廣與改進便如雨後春筍般地興起;而這些方法在本 質上,皆是在描述訓練語句與語音辨識器所產生對應詞圖(Word Graph)之間的關係。本 論文首先將統整與歸納近年來所發展的多種鑑別式聲學模型訓練方法,並以三種最具代 表性鑑別式訓練方法:最小化分類錯誤(Minimum Classification Error, MCE)、最大化交 互資訊(Maximum Mutual Information, MMI)、最小化音素錯誤(Minimum Phone Error, MPE)為範例,透過有系統地轉換與化解方程式,得到聲學模型訓練準則的共通表示函 數型態。我們可以發現到,對於...
متن کامل多語聲學單位分類之最佳化研究 (The Study of Acoustic Model Clustering in Multilingual Speech Recognition) [In Chinese]
由於全球化的形成,人與人之間的溝通不再限於同一種語言,因此多語的語音辨識也變 的格外的重要。如何有效整合多語的聲學模型是一個關鍵議題,因為一組好的多語聲學 單位將影響辨識結果。本論文提出了一套整合專家背景知識與實際語音分析的方法,來 產生一組新的聲學單位,並且對這組聲學單位的數目,使用差分貝式資訊法則來做最佳 的處理。從訓練好的隱藏式馬可夫聲學模型中,計算其單位間的相似度矩陣,之後透過 語音學和音韻學的知識,限定了各個聲學單位能群化的上限,根據不同限定的群化上 限,使用聚合階層式分群法,來建立不同的結構樹。之後,利用差分貝式資訊法則,將 每個結構樹中發音相近的聲學單位做合併,當差分貝式資訊法則的值小於零的時候,就 停止合併,而新合併成一群的聲學單位則為新的聲學單。我們將用 ForSDAT01 華台雙語 語料庫來實驗評量,而實驗結果顯示,本論文所提出的新方法比只用專家知識所定義的 聲學...
متن کامل調變頻譜正規化法使用於強健語音辨識之研究 (Study of Modulation Spectrum Normalization Techniques for Robust Speech Recognition) [In Chinese]
The performance of an automatic speech recognition system is often degraded due to the embedded noise in the processed speech signal. A variety of techniques have been proposed to deal with this problem, and one category of these techniques aims to normalize the temporal statistics of the speech features, which is the main direction of our proposed new approaches here. In this thesis, we propos...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2006